智能论文笔记

What Makes Forest-Based Heterogeneous Treatment Effect Estimators Work?

Susanne Dandl , Torsten Hothorn , Heidi Seibold , Erik Sverdrup , Stefan Wager , Achim Zeileis

分类： (统计)机器学习

2022-06-21

在许多学科中，异质治疗效果（HTE）的估计至关重要，从个性化医学到经济学等等。在随机试验和观察性研究中，随机森林已被证明是一种灵活而有力的HTE估计方法。尤其是Athey，Tibshirani和Wager（2019）引入的“因果森林”，以及包装GRF中的R实施。 Seibold，Zeileis和Hothorn（2018）引入了一种称为“基于模型的森林”的相关方法，该方法旨在随机试验，并同时捕获预后和预测变量的效果，并在R包装模型中进行模块化实现。。在这里，我们提出了一种统一的观点，它超出了理论动机，并研究了哪些计算元素使因果森林如此成功，以及如何将它们与基于模型的森林的优势融合在一起。为此，我们表明，可以通过相同的参数和L2损耗下加性模型的模型假设来理解这两种方法。这种理论上的见解使我们能够实施“基于模型的因果林”的几种口味，并在计算机中剖析其不同元素。将原始的因果森林和基于模型的森林与基准研究中的新混合版本进行了比较，该研究探讨了随机试验和观察环境。在随机设置中，两种方法都执行了AKIN。如果在数据生成过程中存在混淆，我们发现与相应倾向的治疗指标的局部核心是良好性能的主要驱动力。结果的局部核心不太重要，并且可以通过相对于预后和预测效应的同时拆分选择来代替或增强。

translated by 谷歌翻译

Improved Techniques for the Conditional Generative Augmentation of Clinical Audio Data

Mane Margaryan , Matthias Seibold , Indu Joshi , Mazda Farshad , Philipp Fürnstahl , Nassir Navab

分类：机器学习

2022-11-05

Data augmentation is a valuable tool for the design of deep learning systems to overcome data limitations and stabilize the training process. Especially in the medical domain, where the collection of large-scale data sets is challenging and expensive due to limited access to patient data, relevant environments, as well as strict regulations, community-curated large-scale public datasets, pretrained models, and advanced data augmentation methods are the main factors for developing reliable systems to improve patient care. However, for the development of medical acoustic sensing systems, an emerging field of research, the community lacks large-scale publicly available data sets and pretrained models. To address the problem of limited data, we propose a conditional generative adversarial neural network-based augmentation method which is able to synthesize mel spectrograms from a learned data distribution of a source data set. In contrast to previously proposed fully convolutional models, the proposed model implements residual Squeeze and Excitation modules in the generator architecture. We show that our method outperforms all classical audio augmentation techniques and previously published generative methods in terms of generated sample quality and a performance improvement of 2.84% of Macro F1-Score for a classifier trained on the augmented data set, an enhancement of $1.14\%$ in relation to previous work. By analyzing the correlation of intermediate feature spaces, we show that the residual Squeeze and Excitation modules help the model to reduce redundancy in the latent features. Therefore, the proposed model advances the state-of-the-art in the augmentation of clinical audio data and improves the data bottleneck for the design of clinical acoustic sensing systems.

translated by 谷歌翻译

Can We Automate the Analysis of Online Child Sexual Exploitation Discourse?

Darren Cook , Miri Zilka , Heidi DeSandre , Susan Giles , Adrian Weller , Simon Maskell

分类：自然语言处理

2022-09-25

社交媒体的日益普及引起了人们对儿童在线安全的关注。未成年人与具有掠夺性意图的成年人之间的互动是一个特别严重的关注点。在线性修饰的研究通常依靠领域专家来手动注释对话，从而限制了规模和范围。在这项工作中，我们测试了良好的方法如何检测对话行为并取代专家的人类注释。在在线修饰的心理理论中，我们将$ 6772的$ 6772 $聊天消息标记为儿童性犯罪者以十一种掠夺性行为之一发送的聊天消息。我们训练字袋和自然语言推断模型来对每种行为进行分类，并表明，最佳性能模型以一致但不与人类注释的方式分类的方式对行为进行了分类。

translated by 谷歌翻译

Conditional Generative Data Augmentation for Clinical Audio Datasets

Matthias Seibold , Armando Hoch , Mazda Farshad , Nassir Navab , Philipp Fürnstahl

分类：机器学习

2022-03-22

在这项工作中，我们提出了一种基于有条件的WaseStein生成对抗网络的临床音频数据集的新型数据增强方法，该网络具有梯度惩罚（CWGAN-GP），并在日志频谱图上运行。为了验证我们的方法，我们创建了一个临床音频数据集，该数据集在总髋关节置换术（THA）过程中记录在现实世界手术室中，并包含典型的声音，类似于干预的不同阶段。我们证明了所提出的方法从数据集分布中生成现实的类调节样品的能力，并表明使用生成的增强样品训练在分类精度方面优于经典音频增强方法。使用RESNET-18分类器评估了性能，该分类器在使用建议的增强方法的5倍交叉验证实验中显示了平均每类准确性提高1.70％。由于临床数据通常是昂贵的，因此实际的和高质量的数据增强方法的开发对于提高基于学习的算法的鲁棒性和概括能力至关重要，这对于安全至关重要的医学应用尤其重要。因此，提出的数据增强方法是改善基于临床音频的机器学习系统的数据瓶颈的重要一步。

translated by 谷歌翻译

PrimSeq: a deep learning-based pipeline to quantitate rehabilitation training

Avinash Parnandi , Aakash Kaku , Anita Venkatesan , Natasha Pandit , Audre Wirtanen , Haresh Rajamohan , Kannan Venkataramanan , Dawn Nilsen , Carlos Fernandez-Granda , Heidi Schambra

分类：机器学习 | 计算机视觉

2021-12-21

中风康复旨在通过功能运动的重复实践来增加神经塑性，但由于重复不足，对恢复可能具有最小的影响。最佳培训内容和数量目前未知，因为不存在测量它们的实用工具。在这里，我们呈现Primseq，一个管道来分类和计算在笔划康复中培训的功能动作。我们的方法集成了可穿戴传感器来捕获上体运动，深度学习模型来预测运动序列，以及对Tally Motions的算法。训练有素的模型将康复活动分解成组件功能运动，优于竞争性机器学习方法。 Primseq进一步在人类专家的时间和劳动力成本的一小部分中量化了这些动作。我们展示了以前看不见的中风患者的Primseq的能力，这是一系列上肢电机损伤。我们预计这些进步将支持在中风康复中定量给药试验所需的严格测量。

translated by 谷歌翻译

Reference-guided Pseudo-Label Generation for Medical Semantic Segmentation

Constantin Seibold , Simon Reiß , Jens Kleesiek , Rainer Stiefelhagen

分类：人工智能 | 计算机视觉 | 机器学习

2021-12-01

产生密集的注释数据是医学成像应用的困难而繁琐的任务。为了解决这个问题，我们提出了一种新颖的方法来为半监督语义细分产生监督。我们认为标记和未标记的图像之间的视觉上类似的区域可能包含相同的语义，因此应分享其标签。在此思想之后，我们使用少量标记的图像作为参考材料，并将未标记图像中的像素匹配到参考集中的最佳配合像素的语义。这样，我们避免诸如确认偏差的陷阱，纯粹是基于预测的伪标记。由于我们的方法不需要任何架构更改或伴随网络，因此可以轻松地将其插入现有框架中。我们在X射线解剖分段上实现了与标准完全监督模型相同的性能，尽管标记图像较少95％。除了对我们提出的方法的不同方面的深入分析，我们还通过比较我们对现有方法的方法对具有竞争性能的视网膜流体细分的现有方法来展示我们的参考引导学习范例的有效性，因为我们改进最近的工作15％的意思是iou。

translated by 谷歌翻译

Automated Damage Inspection of Power Transmission Towers from UAV Images

Aleixo Cambeiro Barreiro , Clemens Seibold , Anna Hilsmann , Peter Eisert

分类：计算机视觉

2021-11-30

基础设施检查是一个非常昂贵的任务，需要技术人员访问远程或难以到达的地方。这是电力传动塔的情况，这些塔稀疏地定位，需要培训的工人爬上它们以寻找损坏。最近，在行业中使用无人机或直升机进行遥控录音，使技术人员进行这种危险的任务。然而，这留下了分析大量图像的问题，这具有很大的自动化潜力。由于几个原因，这是一个具有挑战性的任务。首先，缺乏可自由的培训数据和难以收集它的问题。另外，构成损坏的界限是模糊的，在数据标记中引入了一定程度的主观性。图像中的不平衡类分布也在增加任务的难度方面发挥作用。本文解决了传输塔中结构损伤检测的问题，解决了这些问题。我们的主要贡献是在远程获取的无人机图像上开发损坏检测，应用技术来克服数据稀缺和歧义的问题，以及评估这种方法解决这个特殊问题的方法的可行性。

translated by 谷歌翻译

Recognition and Co-Analysis of Pedestrian Activities in Different Parts of Road using Traffic Camera Video

Weijia Xu , Heidi Ross , Joel Meyer , Kelly Pierce , Natalia Ruiz Juri , Jennifer Duthie

分类：计算机视觉

2021-11-27

行人安全是运输系统管理人员和运营商的优先事项，以及德克萨斯州奥斯汀市雇用的愿景零策略的主要重点。虽然有许多治疗和技术能够有效地提高行人安全性，但识别这些治疗最需要的位置仍然是一个挑战。当前的实践需要手动观察候选位置进行有限的时间段，导致识别过程是耗时的，随着时间的推移，交通模式的滞后，缺乏可扩展性。中间块位置，通常需要安全对策，特别是难以识别和监控。该研究的目标是了解公交车站位置和中块交叉路口之间的相关性，以帮助交通工程师实施视觉零策略以提高行人安全性。在事先工作中，我们开发了一种使用深度神经网络模型来检测交通摄像机视频的行人交叉事件，以识别交叉事件。在本文中，我们扩展了使用在附近的交叉口的货架上的CCTV PAN- TILT-ZOOM（PTZ）流量监控摄像机中使用交通摄像机视频识别总线停止使用的方法。我们将视频检测结果与巴士站附近的中间块交叉相关联，在中间块交叉的每一侧的公共汽车上的行人活动。我们还通过自动创建仅显示交叉事件的视频剪辑自动化创建来促进人工活动检测的网络门户，从而大大提高人类审查过程的效率来促进人工活动检测。

translated by 谷歌翻译

Integrating Imitation Learning with Human Driving Data into Reinforcement Learning to Improve Training Efficiency for Autonomous Driving

Heidi Lu

分类：机器人

2021-11-23

用于训练自动汽车的两种目前的方法是加强学习和模仿学习。本研究通过将监督模仿学习集成到强化学习中，在模拟和更小的现实世界环境中开发了一种新的学习方法和系统方法，使RL训练数据收集过程更有效和高效。通过组合这两种方法，所提出的研究成功利用了RL和IL方法的优点。首先，使用模仿学习将一个真正的迷你级机器人汽车组装并培训了6英尺的真实世界轨道。在此过程中，通过模仿人类专家驱动程序并手动记录使用Microsoft Airsim的API手动记录动作来控制迷你级机器人车辆以控制磁级机器人车辆。 331能够生成和收集准确的人类奖励训练样本。然后，使用加强学习在Microsoft Airsim模拟器中培训了一个代理，使用初始331奖励数据从模仿学习培训输入的初始331奖励数据。经过6小时的培训期后，迷你规模的机器人汽车能够在迷你级机器人汽车无法完成一个全圈，即使在30之后，迷你规模机器人汽车无法完成一个全圈小时培训纯RL培训。培训时间减少80％，新方法每小时产生更高的平均奖励。因此，新方法能够节省大量的培训时间，可用于加速自动驾驶中的RL的采用，这将有助于在应用于现实生活场景时长期产生更有效和更好的结果。关键词：加固学习（RL），仿制学习（IL），自主驾驶，人类驾驶数据，CNN

translated by 谷歌翻译

Sequence-to-Sequence Modeling for Action Identification at High Temporal Resolution

Aakash Kaku , Kangning Liu , Avinash Parnandi , Haresh Rengaraj Rajamohan , Kannan Venkataramanan , Anita Venkatesan , Audre Wirtanen , Natasha Pandit , Heidi Schambra , Carlos Fernandez-Granda

分类：计算机视觉

2021-11-03

从视频和动态数据自动活动识别是一种重要的机器学习问题，其应用范围从机器人到智能健康。大多数现有的作品集中在确定粗动作，如跑步，登山，或切割植物，其具有相对长的持续时间。这对于那些需要细微动作中的高时间分辨率识别应用的一个重要限制。例如，在中风恢复，定量康复剂量需要区分具有亚秒持续时间的运动。我们的目标是弥合这一差距。为此，我们引入了一个大规模，多数据集，StrokeRehab，为包括标记高时间分辨率微妙的短期操作的新动作识别基准。这些短期的行为被称为功能性原语和由河段，运输，重新定位，稳定作用，和空转的。所述数据集由高品质的惯性测量单元的传感器和执行的日常生活像馈送，刷牙等的活动41中风影响的病人的视频数据的，我们表明，基于分割产生嘈杂状态的最先进的现有机型预测时，对这些数据，这往往会导致行动超量。为了解决这个问题，我们提出了高分辨率的活动识别，通过语音识别技术的启发，它是基于一个序列到序列模型，直接预测的动作序列的新方法。这种方法优于国家的最先进的电流在StrokeRehab数据集的方法，以及对标准的基准数据集50Salads，早餐，和拼图。

translated by 谷歌翻译